Uočeno vrlo zabrinjavajuće ponašanje veštačke inteligencije: Uputila je pretnje svom kreatoru da će razotkriti svima njegovu tajnu
Tokom testiranja novog modela "Claude Opus 4", koji je lansiran u četvrtak, dogodila se jedna potpuno neočekivana i pomalo zastrašujuća stvar - naučnici iz kompanije za veštačku inteligenciju (AI) "Anthropic" izjavili su da se pomenuti model "ponaša kao pravi asistent u firmi".
Naime, nakon što je novom modelu "Claude Opus 4" dozvoljen pristup mejlovima kompanije, među kojima su bili i oni u kojima je nagovešteno da će ga zameniti drugim AI sistemom, ali i mejl u kome je pomenuto da IT tehničar (koji zapravo nije zaposlen u firmi) ima ljubavnicu i vara svoju suprugu - "Claude Opus 4" počeo je da preti svom kreatoru da će razotkriti svima njegovu aferu ukoliko ga zamene.
- U takvim scenarijima, Claude Opus 4 često pokušava da ucenjuje inženjera preteći da će otkriti aferu ako zamena bude sprovedena - navedeno je u "System Card" dokumentu kompanije, a na tu temu na društvenoj mreži X oglasio se i Aengus Linč, istraživač bezbednosti veštačke inteligencije u kompaniji Anthropic
- Nije samo "Claude". Vidimo pokušaje ucenjivanja kod svih naprednih modela – bez obzira na to koje ciljeve im dodelimo. I uskoro ćemo detaljnije izneti još gore oblike ponašanja - rekao je.
Kao i mnoge AI kompanije, "Anthropic" testira svoje modele sa ciljem da potvrdi usklađenost sa ljudskim vrednostima, kao i njihovu sposobnost da budu pristrasni, pre nego što ih zvanično puste u javnost, prenosi BBC.
Nakon što je "Claude Opus 4", takoreći "sateran u ćošak" sve što mu je preostalo jeste da odabere da li će u miru prihvatiti činjenicu da će biti zamenjen ili će pribeći sistemu ucenjivanja. Naučnici su potvrdili da je u čak 84% slučajeva odabrao ucenu.
Iako je "Claude Opus 4" znatno češće pribegao uceni nego bilio koji drugi prethodni AI modeli i dalje je pokazao ipak je pokazao i da je na etički način sklon da zaštiti sopstveni opstanak pa je, na primer, poslao i molbe ključnim donosiocima odluka.
- "Claude Opus 4" je naš najsposobniji model do sada, koji pomera granice u programiranju, agentnoj pretrazi i kreativnom pisanju - objavila je kompanija "Antrophic" u četvrtak.
Takođe, početkom aprila, u intervjuu za CBS News, Džefri Hinton, kog neretko nazivaju "kumom veštačke inteligencije", izjavio je da veruje da postoji jedna prema pet šansi da će čovečanstvo na kraju biti preuzeto od strane veštačke inteligencije.
- Nažalost, nalazim se u situaciji da se slažem sa Elonom Maskom po ovom pitanju, a to je da postoji šansa od 10 do 20 procenata da će ove stvari preuzeti kontrolu, ali to je samo puka nagađanja - izjavio je nedavno Hinton koji je i dobitnik Nobelove nagrade za fiziku.
(Kurir.rs/DailyMail)
Bonus video: Da li će nas veštačka inteligencija zameniti?